Hugging Face Tokenizers

huggingface Tokenizers 是一个开源项目，它提供了当今最常用的分词器的实现，重点关注性能和多功能性。这些分词器也被用于 Hugging Face 的 Transformers 库。

Hugging Face Tokenizers 的主要特点包括：

Hugging Face Tokenizers 还提供了对多种语言（更多即将推出！）的绑定，包括 Rust（原始实现）、Python、Node.js 和 Ruby

网络资源

(1) Tokenizers - Hugging Face. https://huggingface.co/docs/tokenizers.
(2) GitHub - huggingface/tokenizers: Fast State-of-the-Art Tokenizers .... https://github.com/huggingface/tokenizers.
(3) 日本語でHugging Face Tokenizersを動かす - MNTSQ Techブログ. https://tech.mntsq.co.jp/entry/2021/02/26/120013.
(4) Tokenizer - Hugging Face. https://huggingface.co/docs/transformers/main_classes/tokenizer.

本文作者：Maeiee

本文链接：Hugging Face Tokenizers

版权声明：如无特别声明，本文即为原创文章，版权归 Maeiee 所有，未经允许不得转载！

喜欢我文章的朋友请随缘打赏，鼓励我创作更多更好的作品！